tg-me.com/Python_Community_ru/2594
Last Update:
👩💻 datasketch (https://github.com/ekzhu/datasketch) — это библиотека на Python, которая реализует вероятностные структуры данных для оптимизации работы с большими массивами информации!
🌟 Основные функции включают оценку сходства Jaccard с использованием MinHash и его взвешенной версии, а также подсчет количества уникальных элементов с помощью HyperLogLog и HyperLogLog++. Эти структуры данных позволяют быстро и с минимальным расходом памяти выполнять такие задачи, как поиск похожих элементов и подсчет уникальных объектов.
🔐 Лицензия: MIT
🖥 Github (https://github.com/ekzhu/datasketch)
@Python_Community_ru
BY Python Community

Share with your friend now:
tg-me.com/Python_Community_ru/2594